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摘要 : 数据 多 样 性 是 数据 的 本 质 属性 。 在 信息 技术 突飞猛进 式 发 展 和 开放 科学 数 
据 的 时 代 背 景 下 ,数据 多 样 性 特征 愈 发 明显 。 本 文 首 先 详 细 阐 述 数据 多 样 性 的 内 
外 表现 ， 其 中 内 部 表现 包括 : 科学 数据 生产 过 程 的 不 同 对 象 、 数 据 出 版 的 三 位 一 
体 、 不 同学 科 采 集 暂 存 数 据 时 不 同 的 数据 格式 ; 外 部 表现 包括 数据 生命 周期 加 速 

了 数据 多 样 性 、 科 研 生 命 周 期 增加 了 数据 多 样 性 、 数 据 在 具体 应 用 时 被 型 塑 而 生 
发 的 多 样 性 。 随 后 ， 文 章 简要 介绍 了 数据 多 样 性 的 共同 特征 和 影响 因素 ， 并 从 三 
个 方面 介绍 了 数据 多 样 性 的 应 用 表征 。 对 图 书馆 与 馆 员 来 说 ， 认 识 数据 多 样 性 可 
以 在 一 定 程度 上 帮助 科研 人 员 解 决 数据 汇 交 任务 和 数据 披露 压力 , 让 数据 重用 变 
得 简单 并 符合 理想 的 数据 生态 体系 。 因 此 ， 作 为 一 名 数据 馆 员 ， 需 要 有 数据 管理 
的 能 力 并 了 解数 据 伦理 的 相关 法 律 法 规 、 政 策 与 协议 , 努力 为 科研 人 员 提 供 数据 
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Theoretical Research on Data Diversity 


Abstract: Diversity is the essential attribute of data, especially scientific data. In the context of 
rapid development of information technologies (ITs) and the era of open research data, the 
characteristics of data diversity have become more obvious. Firstly, the paper elaborates the internal 
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and external manifestations of data diversity. The internal manifestations are different objects in the 
Scientific data production process, the trinity of data publishing, and different data formats when 
colleting and depositing data in different disciplines. The external manifestations include data 
curation lifecycle accelerates the diversity of data, the research lifecycle increases the diversity of 
data, and diversity increased because of being sharpening when in practical use. Then, the paper 
describes the common features and impact factors of data diversity, and introduces the application 
representation of data diversity from three aspects. For libraries and data librarians, recognizing the 
diversity of data may probably help researchers solve the required task of data deposit and data 
release in open research data era, and making data reuse simple and creating an ideal data ecosystem. 
Therefore, as a data librarian, the data management capacity and the knowledge of relevant laws, 
regulations, policies, and agreements of data ethics are needed, in order to provide data value-added 
services. 


Keywords: Diversity of data; Scientific data; Research data; Data services 


1 引言 

数据 多 样 性 ， 上 共有 内 在 的 三 个 特性 和 外 在 的 三 个 特性 。 内 在 特性 ， 是 静态 的 ， 是 数据 作 
为 一 个 对 象 或 者 物体 与 生 俱 来 的 特性 。 外 在 特性 ， 是 在 它 与 环境 和 用 户 交 互 之 后 发 生 的 ， 所 
以 是 动态 的 。 数 据 多 样 性 一 直 存 在 , 但 是 未 被 发 现 、 发 觉 和 发 展 的 原因 ， 主 要 是 在 过 去 各 个 
学 科 相 对 独立 较 少 交 又 , 数据 主要 作为 科研 工作 的 附属 物 存在 。 但 是 到 了 数据 驱动 科研 的 时 
代 , 数据 的 价值 和 地 位 不 断 得 到 挖掘 和 重视 ,数据 的 多 样 性 问题 也 越发 凸显 出 来 。 如 果 包 视 
数据 多 样 性 ， 将 会 对 新 的 数据 的 生产 和 管理 带 来 阻碍 。 从 数据 交换 迈 入 到 数据 开放 的 时 代 ， 
从 上 而 下 ， 需 要 按照 政策 指导 和 要 求 对 科学 数据 进行 统一 的 管理 和 汇 缴 ， 甚 至 开放 共享 ， 进 
而 出 现 了 一 系列 的 矛盾 和 问题 。 这 些 矛 盾 和 问题 ， 进一步 促进 了 数据 多 样 性 的 特点 的 凸显 和 
发 挥 。 数 据 安 全 以 及 数据 交易 的 社会 制度 和 相关 政策 的 制定 和 变化 ,尤其 在 我 国 ， 也 促进 了 
数据 多 样 性 的 发 展 。 这 最 后 一 个 原因 尤其 重要 , 因为 美国 和 欧洲 至 今 还 未 清楚 认识 到 数据 多 
样 性 ， 而 我 国 图 书馆 界 却 对 此 早 有 认识 ， 但 是 一 直 未 能 形成 明确 的 概念 并 给 出 定义 ， 直 到 笔 
者 之 一 参与 了 书目 多 样 性 的 研究 之 后 ， 恢 然 大 悟 。 

2020 年 4 月 ， 中 共 中 央 、 国 务 院 发 布 《 关 于 构建 更 加 完善 的 要 素 市 场 化 配置 体制 机 人 
的 意见 》?， 正式 将 “数据 ”作为 一 种 新 型 的 生产 要 素 写 入 文件 ， 并 明确 提出 了 加 快 培育 数据 
要 素 市 场 发 展 的 策略 。 数据 要 素 市 场 化 配置 上 升 为 国家 战略 , 其 重要 性 进一步 凸显 ,2021 年 
10 月 ， 习 近 平 在 中 共 中 央 政 治 局 第 三 十 四 次 集体 学 习 时 强调 ， 把 握 数 字 经 济 发 展 趋势 和 规 
律 ， 推 动 我 国 数字 经 济 健康 发 展 ;。 数 据 资产 化 、 数 据 产品 、 数 据 服务 将 是 推动 数据 要 素 市 


2 中 国政 府 网 .中 共 中 央 国务 院 关 于 构建 更 加 完善 的 要 素 市 场 化 配置 体制 机 制 的 意见 [EB/OL](2020-04- 
09)[2021-09-30]. http://www.gov.cn/zhengce/2020-04/09/content 5500622.htm. (China government website. 
Opinions of the Central Committee of the Communist Party of China and the State Council on building a more 
complete system and mechanism for market-oriented allocation of factors[EB/OL](2020-04-09)[2021-09-30]. 
http://www.gov.cn/zhengce/2020-04/09/content 5500622.htm.) 

3 新 华 社 . 习近平 : 把 握 数字 经 济 发 展 趋势 和 规律 推动 我 国 数字 经 济 健 康 发 展 [EB/OL](2021-10-19)[2021- 
10-20].https://mp.weixin.qq.com/s/46CTSgb-R9fnqn8ILHD72w. (Xinhua News Agency. Xi Jinping: Grasp the 
development trend and law of the digital economy to promote the healthy development of Chinese digital 
economy[EB/OL](2021-10-19)[2021-10-20].https://mp.weixin.qq.com/s/46CTSgb-R9fnqn8ILHD”72w.) 


场 未 来 发 展 的 重要 力量 。 
2 科研 数据 开放 共享 与 数据 多 样 性 理论 的 诞生 

科研 数据 开放 获取 概念 最 早 可 追溯 至 1950 年 代 ， 但 是 在 最 近 十 多 年 内 才 引 起 了 人 们 的 

裔 关注 和 重视 1。2003 年 柏林 宣言 将 科研 数据 作为 学 术 知识 的 一 部 分 并 要 求 开 放 获 取 5， 此 
后 全 球 范围 的 国家 政府 机 构 、 科 研 机 构 、 科 研 资助 机 构 、 学 术 出 版 商 等 利益 相关 者 都 先后 币 
定 了 科研 数据 开放 共享 政策 989101112。 随 着 全 球 越 来 越 多 的 学 术 期 刊 要 求 开 放 共享 论文 底层 
数据 ， 以 及 发 表 数据 论文 的 数据 期 刊 或 混合 期 刊 数 量 不 断 增 加 2， 科 研 数 据 不 再 只 是 科研 活 
动 的 副产品 和 附属 物 ， 而 是 已 经 逐渐 成 为 科研 活动 的 主要 产品 之 一 。 同 时 ， 信 息 科技 为 科 硼 
数据 共享 提供 了 诸如 数据 存储 、 传 输 与 处 理 等 技术 支撑 , 信息 技术 的 不 断 发 展 也 加 快 了 科 硬 
数据 共享 的 步伐 。Elsevier 公司 在 其 2019 年 发 布 的 《科研 的 未 来 : 下 一 个 十 年 的 驱动 因素 与 
场景 》 报告 中 指出 ,以 信息 技术 发 展 为 基础 的 科研 数据 开放 共享 将 成 为 下 一 个 十 年 科研 活动 
最 显著 的 特征 ， 有 望 引 发 科研 组 织 模式 与 科研 创新 模式 的 重大 变革 !4。 

科研 数据 开放 共享 的 必然 结果 之 一 , 是 催生 了 数据 多 样 性 的 概念 和 理论 。 从 国家 层面 而 
言 , 数据 资源 已 经 是 或 即将 成 为 一 种 新 型 生产 要 素 , 全 球 主要 国家 都 在 通过 抢占 科研 数据 开 
放 共 享 的 制高点 ,以 尽 可 能 争夺 全 球 科研 数据 资源 或 保护 本 国 科 研 数据 资源 不 被 收割 。 从 科 
研 机 构 、 科 研 资助 机 构 、 学 术 出 版 商 等 利益 相关 者 的 角度 来 看 , 积极 参与 科研 数据 共享 有 助 
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于 提升 自己 的 影响 力 和 话语 权 。 对 科研 与 学 术 生 态 体系 而 言 , 科研 数据 开放 共享 可 实现 科学 
研究 的 结果 验证 ， 可 以 丰富 学 术 出 版 流程 的 标的 物 ， 并 提升 学 术 出 版 生态 体系 的 民 性 循环 。 
科研 数据 生产 者 、 科 研 数 据 管理 者 、 科 研 数据 使 用 者 在 科研 数据 共享 的 趋势 下 ， 其 主体 多 样 
性 与 数量 增长 趋势 愈 发 明显 。 数 据 多 样 性 原先 只 是 具体 科研 工作 或 数据 处 理工 作 中 需要 面临 
的 问题 , 但 在 开放 科学 和 开放 数据 环境 下 ， 当 我 们 需要 制定 相应 的 共享 规范 与 原则 或 各 种 法 
律 法 规制 度 与 政策 时 , 或 是 基于 科学 数据 提供 相应 的 信息 服务 或 数据 服务 与 知识 服务 时 , 我 
们 就 需要 用 一 个 各 方 同 意 〈 认 同 ) 的 框架 来 考虑 和 看 待 数据 ， 此 时 数据 多 样 性 的 问题 就 必然 
星 现 和 凸显 出 来 。 
3 数据 多 样 性 概念 ， 内涵 与 特征 
3.1 数据 多 样 性 内 涵 
3.1.1 数据 多 样 性 内 在 表现 

数据 多 样 性 的 内 在 表现 包括 以 下 几 方面 。 

首先 ， 数据 本 和 号 就 有 具有 多 样 性 的 特征 。 在 不 同学 科 领 域 ,数据 集 的 形式 不 同 ， 包括 : 社 
会 科学 经 常 使 用 具有 变量 和 数值 的 试 算 表 (sheet) 数据 、 生 命 科 学 等 经 常 描述 组 织 结构 的 编 
码 数据 (code)、 物 理科 学 运用 计算 机 进行 模拟 的 模型 数据 (modeling) 和 以 观测 记录 方式 为 
主 的 科学 学 科 的 数字 图 像 (image and voice record) 等 5。 例 如 图 1 中 的 环境 领域 实测 数据 、 


微生物 测序 数据 、 蛋 白质 序列 数据 、 高 动态 范围 图 数据 相互 之 间 对 比 来 看 都 是 各 异 的 。 
图 1 不 同学 科 领 域 采集 的 数据 ' 


其 次 , 科研 数据 在 数据 集 、 数据 描述 、 元 数据 的 三 位 一 体 也 是 数据 多 样 性 的 内 在 表现 (如 
图 1)， 强 调 的 是 数据 本 身 的 生长 与 发 展 。 其 中 ，(1) 数据 集 又 称 数据 实体 (Data Entity)， 


是 用 来 重复 科研 结果 的 证 据 ;〈2) 数据 描述 是 说 明 数 据 集 的 采集 仪器 、 方 法 、 产 生 过 程 、 资 
助 者 等 的 描述 性 文档 ; (3) 元 数据 就 是 描述 数据 集 的 页 献 者 (或 生产 者 )、 所 属 机 构 、 所 属 


学 科 、 日 期 、 版 本 等 属性 的 信息 ”"。 元 数据 编目 领域 在 用 新 RDA 来 描述 图 书 或 其 他 实体 时 


15 中 国 科 学 技术 协会 .中 国 科技 期 刊 发 展 蓝皮书 (2021〉[M]. 北 京 : 科学 出 版 社 , 2021. (China Association 
for Science and Technology. Blue Book of the Development of Chinese Sci-tech Journals(2021) [M].Beijing: 
Science Press,2021.) 

16 本 研究 提供 。 
17 中 国 科学 技术 协会 .中 国 科 技 期 刊 发 展 赣 皮 书 (2021) [MI]. 北 京 : 科学 出 版 社 , 2021. (China Association 
for Science and Technology. Blue Book of the Development of Chinese Sci-tech Journals(2021) [M].Beijing: 
Science Press,2021.) 
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也 体现 了 数据 多 样 性 ， 即 同一 个 RDA， 在 编目 时 有 不 同 的 选项 ， 如 可 以 用 本 地 控制 词 表 代 


蔡 工 具 包 中 提供 的 词 表 ， 从 而 使 编目 数据 具有 可 扩展 性 '。 
图 2 数据 多 样 性 的 内 在 表现 之 一 


最 后 , 从 计算 机 处 到 


用 以 重复 科 


研 半 困 的 证 据 


| 


数据 


元 数据 


人 器 、 nd 大 者 、 所 
法 、 十 助 者 人 属 机 所 局 学科 、 日 期、 


Ee Ee 


版 本 等 属性 的 信 ， 


数据 的 角度 来 看 , 数据 本 身 也 会 因 各 种 实际 需要 而 变换 成 多 种 格式 。 


例如 同一 组 蛋白 质 组 数据 可 以 用 序列 、 字 上 典 、 元 组 、 列 表 等 方式 来 表示 和 存储 ; 同一 个 物质 


也 可 以 使 用 二 维 或 三 维 结构 图 、 
性 的 一 种 内 在 表现 形式 。 
3.1.2 数据 多 样 性 外 在 表现 


数据 多 样 性 的 外 在 表现 主要 强 
样 性 的 外 部 表现 也 具有 以 下 三 个 方面 。 


分 子 式 、 结 构 简 式 、 电 子 式 等 表示 与 存储 。 这 也 是 数据 多 样 


E 调 数据 的 外 在 可 扩展 、 可 延伸 、 可 应 用 的 多 样 性 。 数 据 多 


首先 ,数据 本 身 在 其 生命 周期 中 或 是 在 数据 生产 或 重用 时 , 会 产生 多 个 不 同 的 版 本 , 每 
个 版 本 或 多 或 少 会 并 入 新 的 数据 ( 集 ) 或 是 从 中 抽取 子 集 ， 这 也 是 一 种 多 样 性 。 不 同 的 数据 


数据 多 样 性 。 


或 者 说 ， 数 据 生命 


集 、 不 同 的 数据 版 本 ， 这 就 是 数据 多 样 性 的 第 
周期 是 数据 多 样 性 不 断 加 速 的 过 程 。 


一 种 外 部 特征 。 可 以 说 ,数据 生命 周期 加 速 了 


图 3 数据 治理 生命 周期 模型 图 0 


开 
共 


放 休学 数据 共享 、 保 存 与 管理 | 3 
享 | (科学 研究 的 可 重复 性 ， 可 检验 性 ,可 重 | 
; 知识 资产 和 知 


大 | » 
人 证 | 下 二 青椒 吧 
占有 至 强化 再 现 


18 胡 小 靖 . 从 数字 化 到 数据 化 : 编目 的 未 来 之 路 [EB/OL](2018-11-26)[2021-11- 
12].http://project.calis.edu.cn/jianbao/73/pdf/2.pdf. (Hu Xiaojing. From digitization to datalization: the future of 
cataloging[EB/OL](2018-11-26)[2021-11-12].http://project.calis.edu.cn/jianbao/73/pdf/2.pdf.) 

19 Digital Curation Center. Curation Lifecycle Model[EB/OL][2021-11- 
19|https://www.dcc.ac.uk/guidance/curation-lifecycle-model. 


20 林 和 弘 .研究 论文 四 影响 度 志 测定 放 吾 新 L 避 动 才 ! 论 文 " 位 于 即时 人 办 了 多 面 的 在 测定 赫 可 能 上 才 召 
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其 次 ， 科 研 生命 周期 增加 了 数据 多 样 性 。 在 了 解 趋势 、 产 生 思 路 、 设 计 组 织 项 目 、 设 计 
数据 分 析 、 交 流 发 布 、 成 果 保 存 这 一 不 断 循环 上 升 的 科研 


实验 、 i 行 实 验 、 数据 收集 组 织 、 


生命 周期 中 , 不 同 的 人 、 不 同 的 生产 者 等 会 产生 不 同 的 数据 ， 不 同时 间 段 的 实验 也 会 产生 不 


同 的 数据 。 也 就 是 说 ， 数 据 的 内 外 部 环境 会 产生 多 检 


样 。 例 如 ， 在 不 同 加 工 阶段 产生 的 不 同 数据 ， 包 括 : 仪器 采集 的 原始 数据 (Raw Data)、 
过 抽取 或 者 合并 的 衍生 数据 (Derived Data)、 经 过 挑选 具有 验证 结果 的 科研 数据 (Research 


Data) ”1。 男 外, 倘 奉 我 们 将 广义 科研 生命 周期 中 的 所 有 涉及 到 的 学 术 记 录 都 视 为 一 种 数 


的 数据 。 每 个 周期 产生 的 数据 也 都 不 一 


经 


外 ， 


并 且 进 行 管理 和 保存 的 话 , 那 数据 本 身 也 是 不 一 样 的 。 随 着 信息 、 数 据 成 为 了 一 种 泛 在 形式 ， 


嵌入 社会 生产 、 生 活 、 消 费 过 程 中 , 信息 资源 的 内 涵 和 边界 也 从 文献 信息 扩展 为 数据 、 文 献 、 
实体 等 一 切 表 现 为 数字 化 形态 的 存在 2。 此 时 ， 数 据 也 就 成 了 一 种 广义 的 、 宽 泛 的 含义 ， 多 


样 性 也 就 随 之 而 凸显 。 


最 后 ， 在 数据 科学 、 大 数据 、 


应 不 同 的 机 器 或 软件 。 


图 4 科研 生命 周期 图 ” 


势 中 ~、 下 在) 


路 | 


人 工 智能 、 数 据 建 模 、 智 能 数据 等 具体 应 用 领域 ， 为 了 适 
应 不 同 机 器 和 应 用 程序 /软件 的 要 求 ， 数 据 势必 会 发 生变 化 ， 要 被 型 塑 、 塑 造 (sharp )， 那 么 
这 一 过 程 会 使 得 数据 的 多 样 性 发 生 了 另外 一 种 改变 , 包括 在 存储 格式 上 面 的 这 种 变化 ,以 适 


数据 多 样 性 内 在 表现 和 外 在 表现 并 不 是 孤立 的 两 个 方面 ， 而 是 数据 多 样 性 的 一 体 两 


两 者 相辅相成 (如 图 2)。 首先， 内 在 表现 中 元 数据 的 属性 


网 


值 就 是 另 一 种 形式 的 外 在 表现 。 数 


据 多 样 性 内 在 表现 形式 越 清晰 、 规 范 ,， 那么 其 被 应 用 的 可 能 性 就 越 大 ， 即 数据 多 样 性 的 外 在 


表现 也 就 越 明 显 。 其 次 ， 从 所 有 科大 


Altmetrics[J]. 科 学 技术 动向 研 


21 中 国 


科学 技术 协会 .中 国 科技 期 刊 发 


f 究 , 2013, 3/4:3, 20-28. ( 


展 蓝 皮 书 (2021) [M]. 北 京 : 科学 


for Science and Technology. Blue Book of the Development of Chinese Sci-tech Journals(2021) [M].Beijing: 


Science Press,2021.) 


22 刘 细 文 .“ 创 新 开发 科技 信息 资源 ， 构 建 人 工 智能 解决 方案 ”报告 [EB/OL](2021-10-15)[2021-11-19]. 
https://news.ruc.edu.cn/archives/348226. (Liu Xiwen. Innovatively develop scientific and technological 
information resources and construct artificial intelligence solutions[EB/OL](2021-10-15)[2021-11-19]. 


https://news.ruc.edu.cn/archives/348226.) 


23 张晓林 .研究 图 书馆 2020: 嵌 入 式 协 作 化 知识 实验 室 ?[ 四 .中国 图 书馆 学 报 ,2012,38(01):11-20. (Zhang 
Xiaolin. Research Libraries 2020: Knowledge Collaboratories? [J]. Journal of Library Science in 


China,2012,38(01):11-20.) 


数据 整体 来 看 ， 数 据 多 样 性 的 外 在 表现 越 丰富 ， 那 么 数 
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据 生 产 的 土壤 和 环境 也 会 更 加 肥沃 和 健康 , 这 就 在 一 定 程度 上 驱使 更 多 的 数据 集 及 其 数据 描 
述 与 元 数据 的 产生 ， 数 据 多 样 性 的 内 在 表现 也 会 更 完整 、 统 一 且 多 样 化 。 
图 5 数据 多 样 性 内 外 表现 相互 关系 


一 定 程度 上 决定 


内 在 表现 。 Eee。 外 在 表现 


能 够 整体 上 提升 


数据 多 样 性 是 在 科研 过 程 和 开放 科学 数据 环境 中 形成 的 数据 多 种 内 外 表现 形式 , 是 数据 
的 本 质 属 性 之 一 ， 目 的 是 为 了 实现 数据 的 高 效 治 理 与 应 用 而 不 断 自我 生长 与 自我 发 展 。 可 以 
说 ， 数 据 多 样 性 既是 手段 ， 也 是 目的 。 
3.2 数据 多 样 性 共同 特征 
3.2.1 主体 多 元 化 

主体 多 元 化 是 数据 多 样 性 的 主要 特征 之 一 。 从 科研 数据 生命 周期 * 来 看 ， 主 体 多 元 化 几 
乎 体现 在 数据 生命 周期 的 所 有 过 程 中 。 例 如， 在 数据 产生 阶段 ,数据 生产 者 是 多 元 化 的 ， 而 
且 不 仅 是 生产 者 数量 多 、 分 布 广 ， 而 且 生 产 者 类 型 多 样 ， 可 能 是 观测 机 器 、 计 算 机 ， 也 可 能 
是 科研 人 员 、 实 验 员 等 。 在 数据 存储 阶段 ,数据 可 能 存储 在 多 样 的 系统 中 ,包括 可 能 存储 在 
机 构 知 识 库 、 公 共 数 据 知识 库 、 个 人 计算 机 等 多 个 不 同系 统 中 。 从 内 在 表现 来 看 ， 元 数据 、 
数据 描述 、 数 据 集 的 维护 主体 同样 也 是 多 元 化 的 。 元 数据 的 主体 可 能 是 图 书馆 和 人 馆 员 , 或 是 


存储 人 员 ， 数 据 描述 和 数据 集 的 主体 可 能 是 科研 人 员 或 观测 机 器 。 
图 6 数据 生命 周期 的 主体 多 元 化 


0 Les ss 


生产 者 多 元 化 
描述 者 多 元 化 匡 : 玫 :8 汪汪 2. 数据 收集 收集 者 多 元 化 
ae 攻 砚 次 主体 多 元 化 ee 


分 析 者 多 元 化 存储 系统 多 元 化 
一 
3.2.2 协同 发 展 
数据 多 样 性 另 一 个 特征 就 是 不 同 主体 之 间 协 同 发 展 。 科研 人 员 产 出 数据 集 后 , 还 需要 数 
据 管理 (或 治理 ) 人 员 对 数据 的 描述 、 元 数据 等 做 加 工 和 处 理 ， 之 后 分 析 人 员 可 能 只 选择 一 
部 分 数据 或 子 数据 做 分 析 和 可 视 化 ， 使 用 人 员 也 会 基于 此 科研 数据 产生 新 的 数据 或 数据 描 


24 Stobierski T. 8 steps in the data life cycle[EB/OL](2021-02-02)[2021-10-19]. 
https://online.hbs.edu/blog/post/data-life-cycle?tempview=logoconvert. 


述 , 以 及 正在 形成 或 未 来 可 能 会 形成 的 负责 数据 商品 交易 的 交易 员 或 交易 平台 以 销售 数据 产 
品 53 等 。 可 见 ， 在 数据 生命 周期 中 或 科研 数据 生态 体系 中 ， 扮 演 或 发 挥 不 同 角色 的 主体 之 间 
相互 协同 、 多 元 共 治 ， 共 同 推动 科研 数据 多 样 性 。 
3.2.3 共同 规则 的 制定 

为 了 实现 数据 多 样 性 , 尤其 是 推动 数据 多 样 性 内 在 表现 的 统一 、 完 整 , 科学 界 、 出 版 界 、 
图 书馆 界 等 不 同 参与 方 之 间 应 在 相互 协作 的 基础 上 , 制定 出 共同 的 规则 , 推动 数据 的 长 效 治 
理 与 高 效 利 用 。 目 前 国际 上 已 经 出 台 了 与 科研 数据 相关 的 一 系列 规则 和 标准 。 例如， 在 元 数 
据 标 准 方面 ， 全球 已 有 约 65 个 科研 数据 元 数据 标准 %*， 其 中 常见 的 有 : Dublin Core、 数 据 文 
档 计 划 DDI、 生 态 元 数据 语言 EML、 地 理 空间 领域 的 ISO 19115 和 FGDC-CSDGM 等 。 数 
据 管 理 与 共享 方面 ， 有 全 球 众多 的 组 织 和 机 构 认 可 的 FAIR 数据 共享 原则 ”， 在 数据 引用 方 
面 ， 数 据 出 版 和 存储 系统 尽量 为 每 条 数据 提供 永久 唯一 标识 符 〈persistent identifiers， 简 称 
PID) 或 唯一 标识 符 (Digital ObjectIdentifier， 简 称 DOI); 数据 引用 原则 和 标准 等 3829303132。 
目前 ， 研 究 数据 联盟 RDA 和 世界 数据 系统 WDS 共同 设立 了 学 术 链接 交换 工作 组 ， 努 力 于 
定论 文 -研究 数据 之 间 的 关联 规则 并 提供 服务 3。 美国 信息 标准 办 公 室 NISO 也 宣布 启动 新 项 
目 来 关联 出 版 商 与 知识 库 之 间 的 工作 流 , 实现 研究 数据 -论文 之 间 的 相互 链接 , 针对 元 数据 、 
术语 、 数 据 -论文 关系 的 引用 /链接 类 型 等 形成 一 系列 标准 或 最 佳 实践 ?4。 
4 数据 多 样 性 影响 因素 

前 文 所 述 , 数据 多 样 性 既是 手段 也 是 目的 。 那 么 , 如 何 才能 达到 数据 多 样 性 这 一 目的 呢 ? 
或 者 说 怎么 样 去 驱动 并 保持 数据 多 样 性 ? 本 文 从 以 下 三 方面 简要 阐述 。 
4.1 环境 因素 

以 自然 环境 为 首 的 一 系列 环境 ， 包 括 政治 环境 、 经 济 环境 、 法 律 环境 、 科 技 环境 等 ， 是 
人 类 生存 和 生活 的 基础 。 从 一 定 程度 上 而 言 ， 对 于 数据 多 样 性 ， 这 些 环境 因素 也 是 主要 影响 


[a] 


= 


25 Sands GE. How to build great data products[EB/OL](2018-10-30)[2021-10-20].https://hbr.org/2018/10/how- 
to-build-great-data-products. 

26 Chen Sean, Alderete KA, Ball A. The RDA metadata standards directory[EB/OL][2021-10-23].http://rd- 
alliance.github.io/metadata-directory/standards/. 

27 Wilkinson, M. D. et al. The FAIR Guiding Principles for scientific data management and stewardship[]]. 
Scientific Data, 2016, 3: 160018. 

28 Data Citation Synthesis Group: Joint Declaration of Data Citation Principles[EB/OL](2014)[2021-10-23]. 
https://www.forcell1.org/datacitationprinciples. 

29 ESIP Data Preservation and Stewardship Committee: Data Citation Guidelines for Earth Science Data, Version 
2[EB/OL](2019-07-03)[2021-10- 
23].https://esip.figshare.com/articles/online resource/Data Citation Guidelines for Earth Science Data Version 
_2/8441816/1. 

30 U.S. Geological Survey. Data Citations[EB/OL].[2021-10-24].https://www.usgs.gov/products/data-and- 
tools/data-management/data-citation. 

31 Social Science Data Editors. Guidance on Data Citations[EB/OL][2021-10-25].https://social-science-data- 
editors.github.io/guidance/addtl-data-citation-guidance.html. 

32 I40C. Initiative for Open Citations[EB/OL][2021-10-25].https://i40c.org/#about. 

33 Research Data Alliance. RDA/WDS Scholarly Link Exchange (Scholix) WG[EB/OL][2021-11- 
16].https://www.rd-alliance.org/groups/rdawds-scholarly-link-exchange-scholix-weg. 

34 The National Information Standards Organization. NISO Announces New Project to Integrate Publisher and 
Repository Workflows[EB/OL](2021-10-27)[2021-11-16]. http://www.niso.org/press-releases/2021/10/niso- 
announces-new-project-integrate-publisher-and-repository-workflows. 
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因素 。 尤 其 是 开放 共享 的 环境 和 各 种 完善 的 法 律 、 科 技 、 经 济 环 境 ， 都 是 数据 多 样 化 生产 和 
使 用 的 基础 因素 。 此 外 ， 竞 争 环境 ， 包 括 个 人 层面 、 机 构 层 面 、 国 家 层面 的 竞争 ， 也 是 数据 
多 样 性 的 重要 因素 。 没 有 竞争 ， 就 可 能 会 出 现 垄断 局 面 ， 这 势必 不 利于 数据 多 样 性 。 

4.2 技术 手段 

在 信息 化 、 数 字 化 时 代 ， 数据 通常 以 数字 化 的 形式 存储 和 展示 ,数字 化 的 数据 离 不 开 数 
据 库 、 网 络 与 信息 通讯 技术 统称 为 信息 技术 )。 在 人 工 智 能 时 代 ， 人 工 乔 能 技术 能 够 影响 
数据 多 样 化 子 集 的 推荐 、 大 数据 处 理 与 分 析 、 数 据 高 速 存储 与 传输 等 方面 ， 进 而 也 会 影响 数 
据 多 样 性 。 此 外 ， 区 块 链 、 云 计算 等 技术 也 会 影响 数据 的 存储 与 传输 ， 数据 分 析 与 可 视 化 技 
术 会 影响 数据 的 应 用 与 展示 , 这 些 技术 都 会 从 各 个 层次 和 角度 影响 数据 多 样 性 , 尤其 是 数据 
多 样 性 的 外 在 表现 。 

4.3 标准 遵从 

如 果 不 遵从 标准 规范 ,那么 数据 就 不 只 是 具有 多 样 性 ， 而 是 变 得 混乱 无 序 ， 乃 至 无 法 被 
发 现 、 被 访问 、 被 获取 、 被 利用 。 科 研 数 据 相 关 的 一 系列 标准 ， 包 括 数据 出 版 标准 、 数 据 引 
标准 、 元 数据 标准 、 数 据 描述 标准 、 数 据 使 用 标准 及 未 来 可 能 的 研究 数据 -论文 链接 标准 
等 ， 都 是 数据 有 序 规则 下 多 样 化 的 保障 手段 。 假设 数据 生态 体系 中 的 所 有 利益 相关 者 (包括 
生产 者 、 出 版 者 、 管 理 者 、 使 用 者 、 资 助 者 等 ) 都 不 遵从 各 种 标准 ， 那 么 数据 生产 者 的 权益 
无 法 保障 ， 数 据 共 享 的 方式 无 从 知晓 ， 甚 至 是 未 来 可 能 出 现 的 数据 价值 评估 、 数 据 产 品 / 商 
品 交易 无 法 形成 。 

在 《重新 认识 图 书馆 》s5 中 指出 : 新 型 图 书馆 服务 ， 应 当 具 有 : 资源 为 基 ， 技 术 为 副 ， 
需求 为 本 ， 服 务 为 王 。 本 文 认为 对 于 数据 多 样 性 而 言 ， 环 境 为 基 ， 技术 为 由， 标准 为 本 。 三 
者 结合 , 才能 保证 数据 多 样 性 的 良性 发 展 ， 以 及 在 此 基础 上 开展 的 数据 应 用 和 数据 服务 ， 
至 是 基于 数据 、 文 献 、 知 识 等 结合 的 情报 服务 、 智 库 服 务 和 智能 服务 等 。 当 然 ， 这 里 的 标准 
为 本 不 是 说 就 “死守 ”已 有 各 种 标准 ， 而 是 指 各 种 原则 、 标 准 是 保障 数据 多 样 性 的 原本 或 根 
本 。 
5 数据 多 样 性 理论 的 应 用 表征 

数据 多 样 性 涉及 多 个 学 科 领 域 ， 包 括 商 业 智 能 (Business Intelligence， 简 称 BI)、 数 据 
库 、 网 络 与 信息 通讯 、 数 据 出 版 、 战 略 规 划 〈 数 据 策 略 )、 数 据 模 型 (或 数据 建 模 )、 数 据 治 
EE、 数据 质量 、 数 据 素 养 、 小 数据 应 用 、 智 能 数据 等 。 

5.1 数据 战略 中 蕴藏 的 数据 多 样 性 

数据 多 样 性 体现 在 方方面面 ,在 污染 监测 领域 , 数据 多 样 性 可 以 帮助 企业 遵守 环境 法 规 ， 
数据 科学 家 们 通过 从 企业 运营 中 捕获 的 环境 数据 , 可 以 将 其 与 其 他 运营 数据 一 起 分 析 , 进而 
通过 创建 可 操作 的 洞察 力 来 提供 企业 竞争 优势 ， 提 高 业务 效率 %。 不 过 真正 多 样 化 的 数据 驱 
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35 初 景 利 . 重新 认识 图 书馆 [EB/OL](2021-10-18)[2021-10-20].http://t.cn/A6MWViP5. (Chu Jingli. Re- 
understanding the library[EB/OL](2021-10-18)[2021-10-20].http://t.cn/A6MW ViP5.) 
36 Data Diversity[EB/OL]|[2021-09-26].http://www.datadiversity.net/. 


动 战略 ， 是 要 超越 组 织 〈 或 机 构 、 企 业 ) 已 有 的 现成 数据 或 最 容易 收集 的 数据 ， 从 其 主要 活 
动 和 运营 中 立即 可 用 的 数据 之 外 的 数据 中 发 现 新 东西 了。 例如 ， 在 营销 领域 ， 广 告 商 通过 分 
析 他 们 的 产品 如 何 、 何 时 和 何 地 被 谈论 、 拍 照 和 发 布 到 社交 媒体 ， 以 更 好 地 了 解 客 户 ; 在 农 
业 方 面 ， 农 民 已 经 习惯 使 用 卫星 和 气象 数据 来 确定 作物 的 最 佳 时 间 和 位 置 *。 
5.2 数据 多 样 性 在 大 数据 聚 类 中 的 应 用 
计算 机 科学 家 们 也 在 积极 探索 、 开 发 和 利用 数据 多 样 性 。 例 如 ，MIT 计算 机 科学 和 人 工 
智能 实验 室 联 合 MIT 信息 与 决策 系统 实验 室 的 研究 人 员 就 提出 了 一 种 基于 多 样 性 的 新 算法 ， 
保证 从 海量 数据 集中 抽取 样本 子 集 时 ， 各 子 集 能 保留 完整 集中 的 多 样 性 特征 3》”。 这 一 算法 可 
应 用 于 各 种 推荐 场景 ， 如 图 书 或 电影 等 推荐 ， 还 可 用 于 大 规模 学 习 中 %。 数 据 多 样 性 这 一 属 
性 在 许多 其 他 应 用 场景 中 也 都 发 挥 了 关键 的 作用 , 例如 基因 网 络 子 采 样 、 文 档 提 炼 总 结 、 视 
频 摘要 化 、 内 容 驱 动 搜索 、 推 荐 系统 、 传 感 占 放置 ， 及 新 闻 标 题 或 检索 结果 提示 、 影 像 或 昭 
片场 景 聚 类 、 引 文 链 研 究 方 向 识别 、 生 物 序列 或 多 媒体 数据 聚 类 等 41。 
5.3 数据 多 样 性 在 小 数据 领域 的 体现 
数据 多 样 性 还 体现 在 小 数据 领域 。 小 数据 尽管 没有 统一 的 定义 , 诊断 数据 、 物 种 研究 数 
据 等 都 属于 小 数据 。 所 以 ， 某 些 科 研 数 据 也 算是 一 种 小 数据 。2021 年 9 月 ， 美 国 网 络 安全 
和 新 兴 技 术 局 发 布 的 研究 报告 《小 数据 人 工 智能 的 巨大 潜力 》 中 指出 ， 小 数据 方法 是 一 种 只 
需 少量 数据 集 就 能 进行 训练 的 人 工 智 能 方法 ， 适 用 于 数据 量 少 或 没有 标记 数据 可 用 的 情况 ， 
减少 对 人 们 收集 大 量 现实 数据 集 的 依赖 和 。 小 数据 方法 包括 迁移 学 习 、 数 据 标 记 、 人 工 数 
生成 、 贝 叶 斯 方法 、 强 化 学 习 3， 这 些 方法 可 用 于 图 像 识 别 、 机 器 学 习 等 领域 。 其 中 ， 迁 移 
学 习 、 数 据 标 记 和 主动 学 习 都 符合 前 文 所 述 数据 多 样 性 的 特征 。 
6 开放 科学 数据 环境 下 科研 人 员 的 痛 点 与 图 书馆 及 馆 员 的 机 遇 
6.1 开放 科学 数据 环境 下 科研 人 员 的 痛 点 
开放 科学 和 开放 数据 环境 下 , 科研 人 员 的 痛 点 和 难点 也 越 来 越 多 。 首 先 ， 科研 人 员 和 研 
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究 团 队 需 要 应 对 越 来 越 多 的 数据 汇 交 任务 ,包括 制定 数据 管理 计划 、 开 放 数 据 、 提 交 元 数据 、 
长 期 保存 等 ， 还 要 应 对 科研 诚信 、 科 研 伦理 和 绩效 考核 等 4454647。 
图 7 科研 人 员 需 应 对 的 数据 任务 与 职责 * 
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其 次 ,数据 披露 已经 成 为 


开 究 者 (EE 应 对 科研 伦理 > 


科研 人 员 的 压力 。 在 开放 数据 研究 中 发 现 ， 科研 团队 及 其 研究 


人 员 在 面临 数据 披露 时 还 要 考虑 一 些 外 部 资金 、 相 关 规 范 等 , 他 们 需要 有 人 能 为 其 提供 全 流 


程 的 数据 咨询 服务 2， 而 不 是 


简单 的 指南 或 最 佳 实践 。 
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图 8 科学 数据 重用 生态 系统 3 
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- 科研 数据 重用 生态 系统 -- 
最 后 ， 数 据 重 用 难以 实现 。 数据 重用 的 理想 状态 或 者 说 理想 的 数据 生态 体系 是 ， 科研 人 
员 在 利用 开放 数据 后 能 产生 新 的 数据 或 数据 库 并 开放 给 其 他 人 共享 。 但 是 经 调研 , 有 些 科 研 
人 员 在 面 对 数 据 开 放 时 就 会 变 得 犹豫 和 迟疑 ， 这 就 使 得 数据 重用 变 得 困难 ;1。 
图 9 科研 数据 重用 机 制 好 
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6.2 开放 科学 数据 环境 下 数据 馆 员 面临 的 挑战 

馆 员 需要 重新 认识 数据 多 样 性 , 找到 科研 人 员 的 数据 痛 点 , 以 帮助 科研 人 员 解 决 上 述 问 
题 和 麻烦 ， 不 过 也 面临 着 一 系列 的 挑战 。 

首先 ， 数 据 馆 员 面临 的 挑战 是 数据 管理 的 能 力 ， 包 括 存储 、 管 理 、 汇 交 、 保 存 的 能 力 。 
当然 ， 数 据 管理 的 能 力 需 要 信息 基础 设施 的 文 持 和 数据 馆 员 的 业务 文 持 。 同 时 ,在 科研 流程 
中 ， 前 、 中 、 后 等 各 个 不 同 阶段 所 需要 的 数据 支持 也 不 一 样 。 
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Research Data Reuse Behavior of Chinese Researchers[J]. Journal of the China Society for Scientific and 
Technical Information,2021.) 

51 张 潇 月 , 宋 秀 芳 , 顾 立 平 , 刘 金 亚 , 陈 新 兰 .我 国 科研 人 员 科 研 数 据 重 用 行为 影响 因素 实证 研究 四 .情报 学 报 ， 
2021. (Zhang Xiaoyue, Song Xiufang, Gu Liping, etc. An Empirical Study on the Influencing Factors of Scientific 
Research Data Reuse Behavior of Chinese Researchers[J]. Journal of the China Society for Scientific and 
Technical Information,2021.) 

52 制图 : 张 满月 。 
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图 10 不 同 研究 阶段 馆 员 应 具备 的 数据 管理 能 力 ” 
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其 次 , 馆 员 面临 的 第 二 个 挑战 是 数据 伦理 的 交流 ， 包 括 法 律 、 法 规 、 政 策 和 协议 。 作 为 
数据 馆 员 来 说 ,应 该 了 解 著作 权 法 *、 数 据 安全 法 ”、 个 人 信息 保护 法 %， 以 及 数据 管理 办 法 
5 、 出 版 管理 条 例 有 、 电 子 出 版 物 出 版 管理 规定 ?; 还 应 该 了 解 相关 的 宏观 政策 ， 例 如 知识 产 
权 强 国 建设 纲要 %、 学 术 期 刊 繁荣 发 展 的 意见 9、 人 才 强 国 战略 ;以 及 知识 共享 (CC ) 许可 
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协议 2、 自 由 软件 许可 ”“、 数 据 库 使 用 协议 等 。 
最 后 ， 数 据 馆 员 在 数据 作为 生产 要 素 的 要 求 下 ， 可 能 还 需要 了 解数 据 增值 的 业务 , 包括 
交办 、 交 换 、 交 易 、 交 涉 。 尽 管 目前 已 经 得 到 广泛 应 用 的 大 都 是 通信 、 电 商 领域 的 数据 55， 


但 相信 在 不 久 的 未 来 , 科学 数据 领域 也 会 展开 数据 交易 , 科研 数据 的 数据 确 权 问 题 也 将 浮现 。 
图 11 分 类 分 级 数据 产权 内 容 % 


| 


个 人 数据 企业 数据 社会 数据 
公共 品 公有 产权 公有 产权 公有 产权 
公有 产权 公有 产权 公有 产权 
准 公共 品 人 ee 
基础 数据 产权 。 | 衍生 数据 产权 衍生 数据 产权 
公有 产权 
私有 品 i 
6.3 与 图 书馆 发 展 相 关 的 资源 系统 建设 与 服务 
图 书馆 作为 信息 资源 的 收藏 、 传 阅 、 服 务 场 所 , 在 万 物 皆 是 数据 的 时 代 ， 跳 出 传统 知识 


资源 的 界限 已 成 为 必然 ”。 图 书馆 在 描述 资源 、 提 供 访问 和 建立 馆藏 以 及 为 数字 资源 的 长 期 
管理 提供 支持 方面 有 着 悠久 的 传统 &， 部 分 图 书馆 也 已 经 开始 参与 数据 开发 、 整 合 和 利用 的 
全 生命 周期 ， 并 在 更 广泛 的 使 命 和 服务 范畴 内 呈现 和 分 析 9。 从 数据 治理 的 角度 而 言 ， 社 会 
直接 面向 数据 , 数据 直接 影响 社会 , 而 图 书馆 居于 其 中 的 角色 , 更 多 不 是 中 介 , 而 是 驱动 者 、 
促进 者 ， 以 及 辅助 者 的 角色 ， 图 书馆 可 以 充分 应 用 已 有 的 文献 领域 的 经 验 积累 ， 从 技术 、 法 
律 、 伦理 等 规则 进行 引导 。 从 知识 服务 的 图 书馆 学 理论 而 言 ,结合 实践 经 验 论证 理论 以 及 需 
要 理论 指导 实践 等 的 角度 ， 都 需要 数据 多 样 性 ， 作 为 数据 服务 的 一 个 理论 支撑 ， 因 为 在 文献 
服务 、 信 息 服务 、 情 报 服务 之 后 ， 数 据 服 务 是 知识 服务 的 最 后 一 块 拼图 。 在 数据 -信息 -情报 
-决策 -评价 的 情报 价值 链 中 ， 数 据 应 被 作为 情报 工作 的 起 点 ?。 

当前 的 开放 科学 生态 体系 , 已 从 第 一 代 的 文献 知识 库 和 数据 知识 库 为 用 户 存储 、 检 索 和 


也 
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使 用 , 走 到 了 第 三 代 文献 和 数据 之 间 的 引用 关联 、 元 数据 关联 和 第 三 方 词 表 关联 的 数据 产品 


阶段 "”。 通 过 标准 规范 的 互 操 作 性 ， 而 非 元 数据 的 互 操 作 愧 


=e， 第 三 代 的 玫 


F 放 科学 生态 体系 ， 


正在 构建 软件 、 代 码 、 数 据 、 文 献 、 引 用 、 评 价 内 容 等 的 “有 机 生长 体 ””。 目 前 ， 数 据 领 


域 以 及 文献 领域 所 形成 的 超大 元 数据 集成 , 正在 朝向 类 似 的 数 扫 
据 产品 原型 有 : 数据 、 数 据 集 、 元 数据 、 关 联 数据 、 语 义 数据 、 开 放 政 府 数 据 、 
数据 论文 与 数据 出 版 等 。 

成 体 ， 在 数据 资源 建设 规划 中 ,就 应 考虑 数据 多 样 性 ,使 得 数据 能 够 
日 价值 。 对 于 已 有 的 数据 资源 ， 也 要 考 
日。 如 果 在 数据 资源 建设 规划 阶 
昌 于 数据 不 同 于 文献 ， 一 且 建 好 了 之 后 ， 
性 原则 的 指导 下 建立 数据 资源 ， 
[发 与 利用 的 良性 循环 。 数据 
重用 ， 其 与 研究 数据 的 FAIR 原则 在 内 
上 保 研究 数据 遵循 FAIR; 反之 ， 
的 元 数据 体系 或 编码 体系 来 描述 、 注 


段 没有 考虑 数据 多 样 怕 
就 会 有 其 限 


多 样 


涵 有 相通 之 处 。 


作为 馆 员 或 数据 馆 员 来 说 ， 从 事 馆 藏 和 
要 职责 ”, 在 此 过 程 中 , 探索 和 


图 书馆 作为 资源 和 
尽 可 能 地 为 后 来 的 人 所 使 用 ， 尽 可 
虑 数据 多 样 性 , 即 数据 如 何 能 够 尽 可 能 地 在 各 种 情景 下 被 使 月 
EE， 或 者 边 建 设 边 规划 ， 那 么 日 
叫 或 无 法 被 更 好 地 使 用 。 反 之 ， 如 果 在 数据 多 档 
且 能 被 用 户 使 用 并 有 利于 科研 , 那么 就 能 不 断 地 开展 数据 资源 天 
生 旨 在 提升 数据 的 可 发 现 ， 可 获得 ， 可 交互 及 可 
图 书馆 重视 数据 多 样 怕 
图 书馆 从 遵循 研究 FAIR 原则 出 发 ， 也 能 保证 使 用 通 月 
释 、 归 档 研 究 数 据 ， 也 就 增强 了 数据 的 多 样 性 。 


能 地 提升 数据 的 使 月 


[0 识 数 据 库 建设 、 管 型 


定 元 数据 标准 即 最 人 


产品 的 方向 发 展 。 初代 的 数 


研究 数据 、 


E 广 政策 已 经 成 为 一 项 主 
主 重 数据 质量 、 可 获取 性 、 


互 操作 至 关 重 要 。 馆 员 可 以 尝试 在 数据 管理 计划 实践 中 ， 认 识 到 数据 多 样 性 的 重要 性 ， 并 通 


过 提升 数据 采 
的 多 样 性 。 此 多 
和 处 理 数据 、 分 析 数据 并 可 视 化 、 保 存 数据 等 ， 为 数据 使 
[了 数据 多 样 性 。 馆 员 在 信息 


服务 ， 这 也 从 外 如 


FP 的 方法 、 政 策 、 标 准 等 的 完备 和 
J] 以 提供 租 入 式 数 据 支持 服务 ， 帮助 科研 人 员 


利用 这 些 信息 


昌 织 经 验 ， 转 移 到 数据 领域 (尤其 是 转移 到 科研 数 所 


极 参与 并 努力 做 好 数据 描述 、 数 据 标记 或 数据 编 


管理 服务 。 


7 结语 


多 样 性 意义 重大 、 景 
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和 有 丰富 的 经 验 


E， 保 障 研究 数据 
基 订 数据 计划 、 整 理 
日 者 和 生产 者 提供 无 颖 对 接 的 配套 


， 还 能 积极 


居 或 小 数据 管理 领域 )， 积 
青 报 系统 提供 更 好 的 数据 加 工 和 


响 深远 。 一切 形式 的 文化 多 样 性 都 是 与 经 济 繁 采 息 恩 相 关 的 竞争 差 
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异化 因素 *。 数 据 多 样 性 ， 作 为 一 种 文化 多 样 性 ， 在 数据 时 代 只 有 被 真正 认识 和 努力 实现 ， 
这 样 的 组 织 才 能 更 好 地 适应 新 思想 、 新 技术 以 及 新 的 社会 和 经 济 挑战 。 从 图 书馆 和 馆 员 角度 
来 说 ， 数 据 多 样 性 是 图 书馆 和 馆 员 提供 数据 服务 的 基石 ， 也 是 数据 情报 工作 的 起 点 ， 同 时 也 
是 图 书馆 和 馆 员 深入 参与 数据 驱动 科学 发 现 的 发 展 机 遇 所 在 。 
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